محدودیت ترافیکی در مسیر‌های منتهی به حرم امام‌رضا(ع) | ترافیک پرحجم در میدان انقلاب اسلامی و کوشش مشهد (۹ بهمن ۱۴۰۳) وزارت ارتباطات از وقوع اختلال در شبکه اینترنت کشور خبر داد (۸ بهمن۱۴۰۳) بسته‌های هدیه ایرانسل به مناسبت عید مبعث + روش فعالسازی بسته‌های هدیه همراه اول به مناسبت عید مبعث + روش فعالسازی چرا DeepSeek باعث سقوط ارزش سهام شرکت‌های هوش مصنوعی شد؟ زمان رونمایی از ناتینگ فون ۳ مشخص شد همه چیز درباره هوش مصنوعی DeepSeek | زلزله‌ای در مدل‌‌های هوش مصنوعی تحقیقات جدید نشان می‌دهد که زنبورهای عسل برای جمع‌آوری غذا چقدر از کندو دور می‌شوند توضیحات وزیر ارتباطات درباره طراحی پلتفرم بازارگاه انرژی برای جلوگیری از ناترازی دستبند سلامتی با طرح پلی‌استیشن، محصول مشترک سونی و شیائومی + عکس آنتن آیفون‌های وارداتی غیرقانونی برگشت | فرآیند رجیستری به زودی تعریف می‌شود آیا سامسونگ در گلکسی S25 از آیفون اپل کپی کرده است؟ مدیر عامل آنتروپیک: هوش مصنوعی می‌تواند تا سال ۲۰۲۷ از هوش انسانی پیشی بگیرد اولین تصاویر رسمی از هدست XR سامسونگ در مراسم رونمایی از گلکسی s۲۵ مقایسه مشخصات سری گلکسی S۲۵ با شیائومی ۱۵ و آیفون ۱۶ + جدول ویدئو | معرفی رسمی Galaxy S25 Ultra مقایسه سری گلکسی s۲۵ با سری گلکسی s۲۴ سامسونگ + جدول قیمت انواع گوشی سامسونگ در بازار | پیش‌فروش گلکسی S۲۵ آغاز شد ویدئو | آنباکس گلکسی اس ۲۵ اولترا از پروژه ۵۰۰ میلیارد دلاری هوش مصنوعی ترامپ چه می‌دانید؟ سری گلکسی S25 سامسونگ رونمایی شد| اعلام قیمت و تاریخ عرضه پرچم‌دار جدید
سرخط خبرها

همه چیز درباره هوش مصنوعی DeepSeek | زلزله‌ای در مدل‌‌های هوش مصنوعی

  • کد خبر: ۳۱۳۲۴۸
  • ۰۸ بهمن ۱۴۰۳ - ۱۷:۲۴
همه چیز درباره هوش مصنوعی DeepSeek | زلزله‌ای در مدل‌‌های هوش مصنوعی
مدل R1 هوش مصنوعی چینی «دیپ‌سیک» (DeepSeek) که به تازگی منتشر شده به سرعت محبوب شده، زنگ خطر را برای رقبای آمریکایی‌اش به صدا در آورده است.

به گزارش شهرآرانیوز؛ DeepSeek AI استارتاپ چینی درحال‌رشدی است که به‌دلیل پیشرفت‌های خود در زمینه هوش مصنوعی موردتوجه جهان قرار گرفته است. DeepSeek نه تنها یک رقیب جدی در برابر غول‌هایی مانند GPT-4 یا Gemini محسوب می‌شود، بلکه با تمرکز بر کارایی، خلاقیت و مسئولیت‌پذیری اخلاقی، الگویی جدید در توسعه هوش مصنوعی تعریف کرده است. شرکت چینی به عقیده بسیاری از کارشناسان یکی از قدرتمندترین مدل‌های هوش مصنوعی رایگان با نام دیپ‌سیک را منتشر کرده است که در ادامه این مطلب آن را معرفی خواهیم کرد.

هوش مصنوعی دیپ‌سیک چیست؟

جدیدترین نسخه از مدل هوش مصنوعی این شرکت که DeepSeek V۳ نام دارد، اواخر ۲۰۲۴ منتشر شد و توسعه‌دهندگان می‌توانند شخصی‌سازی‌شده آن را دانلود و در برنامه‌های خود استفاده کنند. همان‌طور که اشاره کردیم، مدل‌های دیپ‌سیک کاملاً متن‌باز هستند؛ توسعه‌دهندگان می‌توانند آنها را دانلود کنند و برای استفاده در برنامه‌ها و پروژه‌های خود تغییر دهند.

این مدل هوش مصنوعی از معماری نوآورانه‌ای بهره می‌برد که در ادامه به آن می‌پردازیم. همین معماری باعث شده در مقایسه با بسیاری از مدل‌های هوش مصنوعی قدرتمند امروزی از شرکت‌هایی مانند متا و OpenAI که برای استفاه از امکانات پیشرفته آنها باید پول بپردازید، قدرتمندتر باشد.

قابلیت‌های هوش مصنوعی DeepSeek V۳ و برتری آن به رقبا

دیپ سیک می‌گوید که مدل پرچم‌دار آن می‌تواند طیف وسیعی از وظایف و کار‌های مبتنی‌بر متن، نظیر کدنویسی، ترجمه و نگارش مقاله و ایمیل را انجام دهد. همچنین در آموزش آن از پردازشگر‌های گرافیکی H۸۰۰ مخصوص چین از شرکت انویدیا استفاده شده است.

دیپ سیک با تست‌های خود اعلام کرده DeepSeek V۳ هم از مدل‌های قابل‌دانلود و رایگان هم از مدل‌های غیررایگان که فقط از طریق API در دسترس هستند، بهتر عمل می‌کند. به گفته این شرکت و طبق تصویر زیر مدل هوش مصنوعی آن در کدنویسی از مدل‌های دیگر مانند Llama ۳.۱ متعلق به متا، GPT-۴o از OpenAI و Qwen ۲.۵، ۷۲B شرکت چینی Alibaba بهتر عمل کرده است.

دیپ سیک ادعا کرده DeepSeek V۳ با مجموعه داده‌ای از ۱۴ تریلیون و ۸۰۰ میلیارد توکن آموزش دیده است. برای درک بهتر این موضوع باید گفت هر یک‌میلیون توکن معادل حدود ۷۵۰ هزار کلمه است. DeepSeek V۳ از نظر اندازه نیز بسیار وسیع است و از ۶۷۱ میلیارد پارامتر پشتیبانی می‌کند (پارامتر‌ها متغیر‌های داخلی هستند که مدل‌های برای پیش‌بینی یا تصمیم‌گیری از آنها استفاده می‌کنند). با این شرایط، هوش مصنوعی این شرکت تقریباً ۱.۶ برابر از Llama ۳.۱، ۴۰۵B شرکت متا بزرگ‌تر است که از ۴۰۵ میلیارد پارامتر پشتیبانی می‌کند.

نکته جالب دیگر اینکه چینی‌ها مدل پرچم‌دار خود را فقط در ۲ ماه و با هزینه‌ای نزدیک به ۵.۵۸ میلیون دلار آموزش داده‌اند؛ بنابراین در مقایسه با شرکت‌های بزرگی مانند متا و OpenAI این شرکت زمان و منابع کمتری برای مدل هوش مصنوعی خود صرف کرده است.

معماری نوآورانه DeepSeek V۳

دیپ سیک برای توسعه مدل خود از معماری بهینه‌شده‌ای (با نام ترکیبی-از-متخصصان یا MoE) استفاده کرده است که نیاز آن به قدرت محاسباتی گسترده و سخت‎‌افزار‌های قدرتمند را کاهش می‌دهد. این معماری را تیم (متخصص) از سیستم‌های هوش مصنوعی تخصصی در نظر بگیرید که در آن هر به‌اصطلاح «متخصص» شبکه عصبی خود را دارد و برای انجام وظایف مرتبط با خود فعال می‌شوند.

در واقع این معماری پیش از انجام وظایف، پیچیدگی آنها را پیش‌بینی می‌کند و براساس منابعی که در اختیار دارد، (متخصصان) مسیر موردنیاز برای تحقق آن را تعیین می‌کند. همچنین برای انجام هریک از وظایف فقط مرتبط‌ترین سیستم‌های هوش مصنوعی فعال خواهند شد که این امر محاسبات اضافی را به حداقل می‌رساند و سرعت عملکرد مدل را بیشتر می‌کند.

همچنین دیپ سیک قابلیت «پردازش متن‌های بلند» را دارد. درواقع مدل‌های DeepSeek می‌توانند متن‌هایی با طول بیش از ۱۰۰ هزار توکن را پردازش کنند. این قابلیت برای تحلیل اسناد حقوقی، مقالات تحقیقاتی یا داده‌های تاریخی بسیار حیاتی است.

DeepSeek از تکنیک‌های پیشرفته «یادگیری انتقالی» (Transfer Learning) استفاده می‌کند تا مدل‌های آموزش‌دیده در یک حوزه (مثلاً پزشکی) را به سرعت به حوزه‌های دیگر (مانند مالی) تطبیق دهد.

چالش‌ها و ملاحظات اخلاقی DeepSeek

توسعه مدل‌هایی مانند DeepSeek با چالش‌هایی مثل «سوگیری داده‌ها»، «خطر استفاده مخرب از قابلیت‌هایی مانند تولید محتوای جعلی» و «شفافیت» همراه است. تیم DeepSeek با تمرکز بر AI Safety، مکانیزم‌هایی مانند فیلتر‌های اخلاقی و نظارت انسانی را برای کاهش این ریسک‌ها پیاده کرده است.

آزمایش هوش مصنوعی دیپ سیک

برای آزمایش نحوه عملکرد هوش مصنوعی DeepSeek نیز در ادامه به چند مثال اشاره کرده‌ایم. در اولین مورد، از این مدل خواسته‌شده شرح مفصلی از شخصیتی فانتزی (ملکه‌ای که مقابل امپراتوری شیطانی مقاومت می‌کند) بنویسد. سپس DeepSeek V۳ با انتخاب نام، عنوان، سن و ظاهر این شخصیت داستانی فانتزی نوشته است:

همه چیز درباره هوش مصنوعی DeepSeek | قدرتمندترین مدل‌ هوش مصنوعی رایگان

برای آزمایش مهارت این مدل در کدنویسی نیز طبق مثال زیر کد جاوا اسکریپت معیوب به آن داده شده است. همان‌طور که در تصویر زیر مشاهده می‌کنید، دیپ‌سیک بلافاصله مشکل را متوجه شده و ضمن توضیح آن، کد اصلاح‌شده را برای کاربر ارسال کرده است:

همه چیز درباره هوش مصنوعی DeepSeek | قدرتمندترین مدل‌ هوش مصنوعی رایگان

در مثال زیر، توانایی DeepSeek V۳ در بهره‌وری آزمایش شده است. در آن کاربر از هوش مصنوعی خواسته دستور کار مختصری برای جلسه‌ای درباره راه‌اندازی محصولی جدید تهیه کند. سپس هوش مصنوعی فهرست موضوعات پیشنهادی خود را که می‌توان در جلسه مطرح کرد، همراه مدت برنامه‌ریزی‌شده برای آنها به کاربر ارائه کرده است:

همه چیز درباره هوش مصنوعی DeepSeek | قدرتمندترین مدل‌ هوش مصنوعی رایگان

درکل،  درباره عملکرد این مدل گفته شده DeepSeek طیف گسترده‌ای از وظایف مانند نوشتن و رفع مشکلات کد‌های پیچیده را به‌راحتی انجام می‌دهد. همچنین این مدل می‌تواند لحن و سبک نوشته‌های خود را براساس موضوعات مختلف تنظیم کند، اما DeepSeek هم مانند بسیاری از مدل‌های هوش مصنوعی دیگر در پاسخ به موضوعات بسیار خاص ممکن است اطلاعات اشتباه ارائه کند. همچنین ظاهراً DeepSeek V۳ تمایلی به ارائه پاسخ درباره موضوعات تاریخی حساس ندارد.

دسترسی به هوش مصنوعی DeepSeek V۳

هم‌اکنون رایگان می‌توانید از نسخه وب هوش مصنوعی پرچم‌دار چینی DeepSeek V۳ استفاده کنید. البته برای استفاده از آن به حساب کاربری نیاز دارید که از طریق حساب گوگل نیز می‌توان آن را ایجاد کرد. محیط کاربری این سرویس شباهت زیادی به ChatGPT دارد و می‌توانید پس از ورود به حساب خود با آن گفت‌و‌گو کنید. نکته قابل‌توجه اینکه این مدل از زبان فارسی نیز پشتیبانی می‌کند و کاربران ایرانی را تحریم نکرده است.

افزون‌بر نسخه وب، درحال‌حاضر اپلیکیشن DeepSeek برای اندروید و iOS نیز موجود است.

منبع: دیجیاتو

گزارش خطا
ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.
پربازدید
{*Start Google Analytics Code*} <-- End Google Analytics Code -->